2012-04-21 15:01:00
一直比较好奇 boost::bind 里面占位符和参数的顺序是怎么实现的,也一直看不太懂这方面源代码,昨晚好好看了下,终于有点弄懂了。小记一笔,与大家分享。
先看一个简单的用例:
1#include <boost/bind.hpp>
2
3int foo(bool a, int b, double c)
4{
5 return 0;
6}
7
8int main()
9{
10 boost::bind(foo, _2, 2, _1)(3.0, true); // foo(true, 2, 3.0)
11
12 return 0;
13}
这里有两个步骤,第一步是绑定过程,第二步是调用。
绑定过程给出了 boost::bind 所需要的几乎所有信息——只有两个参数——_1 和 _2——的类型和值,有待确定。但是他们的顺序是确定了的,类型实际上也由函数签名所限制。bind 是一个函数,返回一个 bind_t 类型的对象,bind_t 是一个仿函数。
三个参数时 bind_t 应具备的参数信息:
| 参数1 | 参数2 | 参数3 |
|---|---|---|
| 占位符2 | 绑定值 | 占位符1 |
调用的时候给出的参数表只有两个:
| 参数1 | 参数2 |
|---|---|
| 值1 | 值2 |
调用时的参数匹配过程如下:

我们暂且把第二列中的参数表称为 BindList,第三列的参数表称为 CallList。BindList 和 CallList 都需要保存参数,这部分公用的东西先简单实现如下:
1struct BindArguments0
2{
3
4};
5
6template <typename A1>
7struct BindArguments1 : public BindArguments0
8{
9 BindArguments1(A1 a1) : a1(a1)
10 {
11
12 }
13
14 A1 a1;
15};
16
17template <typename A1, typename A2>
18struct BindArguments2 : public BindArguments1<A1>
19
20 BindArguments2(A1 a1, A2 a2) : BindArguments1(a1), a2(a2)
21 {
22
23 }
24
25 A2 a2;
26};
27
28template <typename A1, typename A2, typename A3>
29struct BindArguments3 : public BindArguments2<A1, A2>
30{
31 BindArguments3(A1 a1, A2 a2, A3 a3) : BindArguments2(a1, a2), a3(a3)
32 {
33
34 }
35
36 A3 a3;
37};
为了简洁和突出关键,我们暂时只实现到 3 个参数。从上面的代码看,多一个参数,代码是线性增长的,不是指数级增长的,所以很容易(人工地)扩充到所需要的参数个数。如果需要玩些花样,可以使用宏循环技巧自动生成代码,这部分东西在《C++ 下 Function 对象的实现(下)》中已经谈到过,本文不再赘述。
接下来实现 CallList0 到 CallList3,它除了存储参数,还具备用占位符查询出实际值的能力。占位符实现如下:
1static struct PlaceHolder1
2{
3
4} _1;
5
6static struct PlaceHolder2
7{
8
9} _2;
10
11static struct PlaceHolder3
12{
13
14} _3;
对,就这么简单粗暴就可以了。网上有些文章说使用 int to type,那也可以,做成这样:
1template <int i>
2struct PlaceHolder
3{
4
5};
6
7static PlaceHolder<1> _1;
8static PlaceHolder<2> _2;
9static PlaceHolder<3> _3;
但关键点不在这里。我们只要能对各种占位符区分类型就可以了。下文以第一个简单的定义为准。 CallList 这样子定义(灰色的先假装没看见):
1class CallList0 : public BindArguments0
2{
3public:
4 CallList0()
5 {
6
7 }
8
9public:
10 template <typename T>
11 T operator [](T t)
12 {
13 return t;
14 }
15};
16
17template <typename A1>
18class CallList1 : public BindArguments1<A1>
19{
20public:
21 CallList1(A1 a1) : BindArguments1<A1>(a1)
22 {
23
24 }
25
26public:
27 A1 operator [](PlaceHolder1)
28 {
29 return a1;
30 }
31
32 template <typename T>
33 T operator [](T t)
34 {
35 return t;
36 }
37};
38
39template <typename A1, typename A2>
40class CallList2 : public BindArguments2<A1, A2>
41{
42public:
43 CallList2(A1 a1, A2 a2) : BindArguments2<A1, A2>(a1, a2)
44 {
45
46 }
47
48public:
49 A1 operator [](PlaceHolder1)
50 {
51 return a1;
52 }
53
54 A2 operator [](PlaceHolder2)
55 {
56 return a2;
57 }
58
59 template <typename T>
60 T operator [](T t)
61 {
62 return t;
63 }
64};
65
66template <typename A1, typename A2, typename A3>
67class CallList3: public BindArguments3<A1, A2, A3>
68{
69public:
70 CallList3(A1 a1, A2 a2, A3 a3) : BindArguments3(a1, a2, a3)
71 {
72
73 }
74
75public:
76 A1 operator [](PlaceHolder1)
77 {
78 return a1;
79 }
80
81 A2 operator [](PlaceHolder2)
82 {
83 return a2;
84 }
85
86 A3 operator [](PlaceHolder3)
87 {
88 return a3;
89 }
90
91 template <typename T>
92 T operator [](T t)
93 {
94 return t;
95 }
96};
存储已经由 BindArguments 负责了,CallList 实现了 operator[] 用于从 PlaceHolderN 查询调用时的参数 aN。
还有一个问题,CallList 中的参数个数往往会比 BindList 中的少(其中某几个已经用实际值绑定了),这样,从 BindList 到 CallList 查询的时候,需要判断哪些是 PlaceHolder,哪些是实际参数,这就不太好操作了。为了到时候统一写法,我们让 CallList 不仅支持使用 PlaceHolder 查询,也支持使用实际参数值来查询。增加上面灰色代码,使用实际参数查询的时候,直接返回那个值。
CallList 就到此为止。现在开始实现 BindList。跟 CallList 一样,每个 BindList 都继承 BindArguments。……似乎这样就完事了?BindList 貌似没其他事情好做了。。。不过,BindList 里面保存了最原始的参数个数信息,如果我们不对函数进行萃取的话,参数个数只能从这里获取,因此调用过程只能写在这里——貌似还没说清楚,不要紧,这是后话。暂且把相关代码变灰,等下就可以看到原委了。
1class BindList0 : public BindArguments0
2{
3public:
4 BindList0()
5 {
6
7 }
8
9public:
10 template <typename F, typename A>
11 void operator ()(F f, A a)
12 {
13 f();
14 }
15};
16
17template <typename A1>
18class BindList1 : public BindArguments1<A1>
19{
20public:
21 BindList1(A1 a1) : BindArguments1<A1>(a1)
22 {
23
24 }
25
26public:
27 template <typename F, typename A>
28 void operator ()(F f, A a)
29 {
30 f(a[a1]);
31 }
32};
33
34template <typename A1, typename A2>
35class BindList2 : public BindArguments2<A1, A2>
36{
37public:
38 BindList2(A1 a1, A2 a2) : BindArguments2<A1, A2>(a1, a2)
39 {
40
41 }
42
43public:
44 template <typename F, typename A>
45 void operator ()(F f, A a)
46 {
47 f(a[a1], a[a2]);
48 }
49};
50
51template <typename A1, typename A2, typename A3>
52class BindList3: public BindArguments3<A1, A2, A3>
53{
54public:
55 BindList3(A1 a1, A2 a2, A3 a3) : BindArguments3(a1, a2, a3)
56 {
57
58 }
59
60public:
61 template <typename F, typename A>
62 void operator ()(F f, A a)
63 {
64 f(a[a1], a[a2], a[a3]);
65 }
66};
快到最后一步了。我们现在可以来考虑 Bind 的最终形式了——模版类?模板函数?从使用上来说,模版类在用的时候必须给出模版参数,想象一下这样的写法:
1bind<int (bool, int, double), PlaceHolder2, int, PlaceHolder1>(foo, _2, 2, _1))
……太没有易用性了。而模版函数则不用事先给出模版参数。boost::bind 也实现成了一组模板函数。同时,函数 Bind 返回的东西必须是可执行体,而且要包含一个BindList,C++ 里面只有仿函数能做到。这个结构我们定义为 BindT。先看代码:
1template <typename F, typename BL>
2class BindT
3{
4public:
5 BindT(F f, BL bl) : f(f), bl(bl)
6 {
7
8 }
9
10public:
11 void operator ()()
12 {
13 bl(f, CallList0());
14 }
15
16 template <typename A1>
17 void operator ()(A1 a1)
18 {
19 bl(f, CallList1<A1>(a1));
20 }
21
22 template <typename A1, typename A2>
23 void operator ()(A1 a1, A2 a2)
24 {
25 bl(f, CallList2<A1, A2>(a1, a2));
26 }
27
28 template <typename A1, typename A2, typename A3>
29 void operator ()(A1 a1, A2 a2, A3 a3)
30 {
31 bl(f, CallList3<A1, A2, A3>(a1, a2, a3));
32 }
33
34private:
35 F f;
36 BL bl;
37};
BindT 保存了函数 f 以及 BindList bl。我们找一个 operator()(A1 a1) 来看,里面写成了 bl(f, CallList1(a1));,这得益于 BindList 里面实现了 operator()()。
按通常理解,可能会写成这样:
1CallList1<A1> cl(a1);
f(cl[bl.a1], cl[bl.a2], ……) 等等,bl 里面到底有几个元素?这就不知道了,因为 BindT 接受的只是一个 BindList,所以需要 BindList 给出执行形式。因此,上面 BindList 需要灰色部分的 operator()() 代码。(当然,也可以换种实现方法,抛弃 BindList,在 BindT 中将参数散开来,这看上去也是可行的。)
最后,给出一组 Bind 模版函数,作为最终使用接口:
1template <typename F>
2BindT<F, BindList0> Bind(F f)
3{
4 return BindT<F, BindList0>(f, BindList0());
5}
6
7template <typename F, typename T1>
8BindT<F, BindList1<T1>> Bind(F f, T1 t1)
9{
10 return BindT<F, BindList1<T1>>(f, BindList1<T1>(t1));
11}
12
13template <typename F, typename T1, typename T2>
14BindT<F, BindList2<T1, T2>> Bind(F f, T1 t1, T2 t2)
15{
16 return BindT<F, BindList2<T1, T2>>(f, BindList2<T1, T2>(t1, t2));
17}
18
19template <typename F, typename T1, typename T2, typename T3>
20BindT<F, BindList3<T1, T2, T3>> Bind(F f, T1 t1, T2 t2, T3 t3)
21{
22 return BindT<F, BindList3<T1, T2, T3>>(f, BindList3<T1, T2, T3>(t1, t2, t3));
23}
好了,简单实现到此为止。我们这里只是注重了参数表如何存储,如何使用占位符更改顺序,对于其他问题则没有做过多考虑。还有诸如 const/非const、有返回值/无返回值,引用/非引用、函数指针/成员函数/仿函数等问题都没有涉及。以上代码仅仅支持普通函数,不支持成员函数和仿函数。
做个简单的测试:
1int foo0()
2{
3 return 0;
4}
5
6int foo1(int a)
7{
8 return 0;
9}
10
11int foo2(int a, int b)
12{
13 return 0;
14}
15
16int foo3(int a, int b, int c)
17{
18 return 0;
19}
20
21int main()
22{
23 Bind(foo0)();
24 Bind(foo1, _1)(1);
25 Bind(foo1, 2)();
26 Bind(foo2, _1, _2)(1, 2);
27 Bind(foo2, _2, _1)(1, 2);
28 Bind(foo2, _1, 1)(2);
29 Bind(foo2, 1, _1)(2);
30 Bind(foo2, 1, 2)();
31 Bind(foo3, _1, _2, _3)(1, 2, 3);
32 Bind(foo3, _1, _3, _2)(1, 2, 3);
33 Bind(foo3, _2, _1, _3)(1, 2, 3);
34 Bind(foo3, _2, _3, _1)(1, 2, 3);
35 Bind(foo3, _3, _1, _2)(1, 2, 3);
36 Bind(foo3, _3, _2, _1)(1, 2, 3);
37 Bind(foo3, _1, _2, 3)(1, 2);
38 Bind(foo3, _2, _1, 3)(1, 2);
39 Bind(foo3, _1, 2, 3)(1);
40
41 return 0;
42}
将以上代码合起来(去除开头第一段代码和中间一个 PlaceHolder的代码),就是可运行的程序了。(VS2010通过)
示例程序中的各个结构与 boost::bind 实际代码的对应关系如下:
| 示例代码 | boost |
|---|---|
| Bind | bind |
| BindT | _bi::bind_t |
| BindListN | listN |
| CallListN | listN |
| BindArgumentsN | storageN |
| PlaceHolderN | arg |
BindList 和 CallList 在 boost::bind 的实现中是合并的,这是阅读时的很大干扰源。所以刚才把他们拆了讲,但愿能写明白些。 |
好久没发了,请各位指教。
首发:http://www.cppblog.com/Streamlet/archive/2012/04/21/172241.html